Los modelos de inteligencia artificial de razonamiento de OpenAI están mejorando, pero su tendencia a generar información errónea no está disminuyendo, según los resultados de las pruebas de referencia.